package com.dmcb.trade.business.crawlers.article;

import com.dmcb.trade.business.constants.CrawlConstant;
import org.springframework.stereotype.Service;

/**
 * 和讯网文章解析
 * Created by Administrator on 2016/7/4.
 */
@Service
public class HeXunParser extends BaseParser {

    /**
     * 网站URL网址
     *
     * @return 链接
     */
    @Override
    protected String url() {
        return CrawlConstant.HEXUN_URL;
    }

    /**
     * 获取标题选择器
     *
     * @return 标题选择器
     */
    @Override
    protected String titleSelect() {
        return "h1.news-title,div.article-title>h3,span.ArticleTitleText>a,div#artibodyTitle h1,div.articleName>h1,div.toptitle>h1";
    }

    /**
     * 获取日期选择器
     *
     * @return 发布日期选择器
     */
    @Override
    protected String dateSelect() {
        return "div.ArticleTitle>span#pubtime_baidu,div.clearfix>div>span";
    }

    /**
     * 获取正文内容选择器
     *
     * @return 正文内容选择器
     */
    @Override
    protected String bodySelect() {
        return "div.ArticleBlog,div#artibody,div.art_contextBox";
    }

    /**
     * 获取封面选择器
     *
     * @return 封面选择器
     */
    @Override
    protected String coverSelect() {
        return "div#BlogArticleDetail>div img[src],div.art_contextBox>div>div>div img[src],div#artibody>div>div img[src],div.art_contextBox>div>table>tbody>tr>td>div img[src]";
    }

    /**
     * 获取作者选择器
     *
     * @return 作者选择器
     */
    @Override
    protected String authorNameSelect() {
        return "span#author_baidu";
    }


    @Override
    protected String platform() {
        return "和讯网";
    }
}
